山下2018, リカレント型ニューラルネットワークと Rapidly-exploring Random Tree による環境変化に適応可能なパスプランニング
山下2018, リカレント型ニューラルネットワークと Rapidly-exploring Random Tree による環境変化に適応可能なパスプランニング, JSME conf. on RM, 北九州]
障害物を避けてロボットが移動もしくは姿勢変化を達成するための軌道の生成に関する数多くの手法
ロボットの経路生成に広く用いられるアルゴリズムに,probabilistic road map (PRM) や rapidly-exploring randomtree (RRT),およびそれらの改良アルゴリズムがある.
ランダムサンプリングされたノードを繋げて経路を生成する手法,始点と終点が接続可能な条件下では必ず経路を発見することができる.
対象領域に障害物や他者が存在する状況、動的に環境が変化する状況では,事前に規定するノードを空間内に設定することが困難であるため,固定ノードを利用するダイクストラ法や A*法 3 に比べて,これらの手法が有利
経路生成後に最適化処理を適用することで,品質の高い経路が得られる
しかし,乱数を用いるアルゴリズムであるため
同一の始点と終点に対して発見される経路が探索ごとに変動する
許容される探索時間が十分でない場合には,冗長な経路が発見される場合がある.
以前に生成した経路の知識を再利用する枠組みを持たない.
一方,機械学習による経路生成を行う種々の手法
ニューラルネットワーク(NN: Neural Network)を利用する手法
強化学習と NN を組み合わせる Deep Q-network
事前に大量の学習が必要
学習終了後には高速に経路を生成することができる.
前述の手法と異なり,同一の始点と終点に対して同一の経路が生成される.
さらに,NN の汎化能力により,学習時に利用されなかった条件に対して,経路生成が可能
事前知識としてロボットの身体性を陽に与えることができず,学習のための大量の訓練データを獲得するための試行錯誤が必要であるという側面も持つ.
しかし,多くの産業用ロボットや移動ロボットの身体性は既知であるため学習によって獲得する必要はない
現場に合わせた多くの試行錯誤を行うのは不可能である場合が多いことを考慮した場合,あまり好ましいことではない.
Probabilistic Road Map(PRM) plannerによる経路生成とPythonサンプルコード - MyEnigma
Rapidly-exploring Random Tree:RRTとは - AGIRobots
本論文では,上述の二種類の手法を融合した弱点を補う経路生成手法を提案する.
具体的には,ロボットの身体性や環境を考慮したコンフィグレーション空間において,複数の環境を想定し、大量かつ良質の経路を RRT によって生成する.
それらのデータを利用して,内部に時系列方向の接続を持ち,時系列情報の処理に優れている RNNの一種である LSTMを用いて学習を行う
convolutional autoencoder(CAE)を利用して学習を行うことにより、環境変化に対して適応可能な経路生成ネットワークを提案する.
CAE, RRT, LSTM